解密數據的8個“把戲”
第一,數據的計量單位和范疇很重要
你買油是按照克單價?還是總金額?這個例子比較簡單。實際工作中比這個要復雜很多,比如銷售人員的績效如何評估——應該按照總銷售額,還是可比店的銷售額?是按照所有產品的銷售額?還是新品的銷售額?是按照單店績效?還是單人績效?是按照工作時間內的績效?還是不計工作時間、將加班時間也計算在內的績效?如果是跨國公司,還涉及到用人民幣、還是美元計算?
計量單位的不同、測算范疇的不同,得出的結果也就不同——所以,公司開績效評估大會或者任務指標分配大會,一般就是打數據仗,然后你會發現,結局往往不取決于最準確的數據,而取決于最大的嗓門……
第二,中位數和平均數是有區別的
平均數是一個非常強大的描述性統計數據,也被廣泛用于各種判斷當中,比如時不時會有新聞說“房價在漲”、“我國平均收入水平上升XXX”,“某某學校的升學率高達90%”……平均數最大的問題是,忽略了偏離方差的“異常值”——比如馬云的收入就是個異常值。這個時候,就需要再看一看中位數。
每一次銷售會,我們會看幾個主要數據,類似“單人產量”“單店產量”“流失率”等等。然而,在對這些數據下結論的時候,我們得萬分謹慎,因為一方面,它取決于計量單位和范疇,另一方面,還得均衡的看平均數和中位數。如此才能甄別出來,哪些是由于“異常值”造成的偶然現象,而哪些是一直存在的普遍現象,防止看錯問題冤枉人。當然有一種情況是不需要區分中位數和平均數的,比如今年北大古生物專業的畢業生就業率(就一個姑娘)。
第三,權重很重要
每個企業的績效評估方法可能不一樣,但邏輯應該相似,對所有衡量指標設置不同權重后,進行綜合評估。當然,對于那種只有一個指標(老板心情指標)的公司,統計學表示很無力。
除了績效評估,最常用“權重”的就是生意預測。不同要素對生意結果的影響力不同,且隨時間而變,比如打廣告、公關活動、或者店內促銷,哪個對生意貢獻最大?哪一種具體的廣告形式對生意貢獻最大?是不是贊助《中國好聲音》就一定比投放傳統電視廣告,帶來的銷量更大?只有我們知道不同因素的權重,才會做成更加科學的投資決策。
第四,數據往往只能說明現象,很難說明動機、或者背后原因
銷售額下降了,怎么辦?相信大多數銷售都會抓狂,開始馬不停蹄的琢磨問題解決之道了。但去年我聽到了一句特別灑脫的話:“銷量下降,有時候只是個現象,并不一定是問題。你怎么知道這不是我們有意為之的呢?”呃…好吧,這豁達和深刻,不是我等凡夫俗子能理解的。
數據往往只表達一種結果。如果想要知道數據背后的動機和原因,還要借助更復雜的統計學手段、或者非數據手段。主動為之的“壞數據”以及被動承受的“壞數據”,兩者之間的動機差異,會造成迥然不同的行為結果。比如有一次銷售會議,某區域負責人指著自己慘淡的員工流失率指標,輕描淡寫的解釋說:“高流失率是我主動淘汰了一些人,因XXX原因,下個季度新人馬上到崗。”想象一下,如果我們不了解這個動機,可能這位區域負責人就要蹲小黑屋了。
第五,數據的精確不一定代表準確
最經典的例子就是收入數據。經常有報道說:公務員收入其實很低,勸大家不要錯怪公務員。但問題是,工資收入是低,但非工資收入可能不低。當然,這種情況不僅限于公共組織。其實無論任何組織,只要掙的花的不是自己的錢,就都可能出現這種“工資不等于收入”的情況。
在具體業務中,“精確不等于準確”可能出現在兩種情境中——總結歸納、分析預測。
比如消費者調研,一般都會有定性和定量兩種方法。如果沒有定性分析,定量分析就可能陷入“虛假精確”的陷阱。如果你的調研對象有問題,那么,就算再辛苦的計算和再精確的數據,其實都沒有意義。又比如廣告測試,精確的測試結果真的有實際意義嗎?
又比如銷量預測,每個人心里都明白,這是無法準確預測的,你只能無限接近,卻不能完全準確,因為“預測未來”本來就是上帝才能搞定的事,所以我們能做的,只能是在保證方向準確的情況下,盡量精確。但也不必過于花費力氣、苛求預測數據的精確,因為這不會增加多少實際意義,還不如花多點時間研究其他可操作性強的數據
總之,盡量避免追求虛假的準確和錯誤的確定性。
第六,相關性不一定是因果性
我老板的經典口頭禪就是:“你們這些人,總是自說自話、以果推因分析法,錯把相關性當成因果性,把偶然性當成必然性。”這句口頭禪可真是太強大了,因為可應用范圍頗廣,躺槍幾率也頗高,導致我們現在不得不日省三次:“有沒有自說自話?有沒有以果推因?”
以前還聽過一個段子,一個領導手下的兩個部門同時做生意報告。A部門搞不清楚自己生意為啥漲,B部門搞不清楚自己生意為啥降,結果最后的生意報告中,兩個部門不約而同,提到了同一個原因——天氣。只不過,A部門說,因為這段時間按天氣冷導致A產品需求增大;B部門說,因為這段時間天氣熱導致B產品需求減少。我現在覺得吧,多虧這領導不是我老板,否則這兩部門可以一起蹲小黑屋了。
這就是統計學最重要的價值——可以幫助我們排除無關因素,因為這些無關因素太容易讓大家混淆了因果性和相關性的區別。
第七,被忽略的“大數定律”
有公司做新品上市的消費者調研時,最后需求是:只要超過45%的人喜歡,就決定上市這個新品。其實這壓根不用調研了。如果這個新品和對照組的產品本身差距不明顯的話,且樣本量足夠大,肯定會有50%的人喜歡,這就是大數定律的基本常識。
第八,數據是可以作弊的、是可以有偏見的
初三接近中考時,老師突然要調座位,而且這次不按學號、不按個子、也不按“好幫差”原則,而是直接按成績調座位——成績好的人坐左邊兩組,成績不好的坐右邊兩組。當時我還很懵懂,不明白為啥非要在復習備考的緊張時刻折騰調座位,因為和我關系非常好的小伙伴們都被調到右邊兩組了。
來我終于懂了。因為接下來的兩周,右邊座位的同學們,一個接一個的被老師叫走談話,然后,又一個接一個的,退學了。我想我這輩子都忘不了,那些同學一聲不吭的低頭收拾完書包,佝僂著腰沉重的走出教室前,回頭望過來的最后一眼。那種悲傷和無奈的眼神,讓我至今想起來都心酸喉梗。然后,當年我校的升學率就非常高。
企業當中數據作弊和偏見也不少見,比如通過壓低頭一年的數據、使得第二年增長率更高;比如選擇錯誤的樣本數據做市場調研;又比如常見的會計數據作弊。
總之,數據的把戲大有乾坤。一方面,我們需要數據去分析問題、印證結論,沒有數據的虛談是沒有意義的,也是很難有定論的。另一方面,數據不是全部,我們不能成為“數據教”的人。過于追求數據的完美精確,容易讓我們忽略那些無法用數據表現的關鍵要素,比如人的態度、動機和精神氣;也容易忽略企業的最終目標。其實,在不該使用數據的使用數據,可能比在該用數據的時候沒有數據,結果更可怕。